预训练表征助力扩散模型Tokenizer,加速像素压缩到语义提取
近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 冻结的预训练视觉表征」直接作为潜空间,以显著提升扩散模型的生成性能。
模型 表征 语义 tokenizer 模型tokenizer 2025-11-13 19:14 6
近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 冻结的预训练视觉表征」直接作为潜空间,以显著提升扩散模型的生成性能。
模型 表征 语义 tokenizer 模型tokenizer 2025-11-13 19:14 6